DeepSeek V4
DeepSeek 下一代旗舰开源 MoE 模型,Preview 已于 2026-04-24 发布(web / app / API 同步上线,开源权重见 Hugging Face),分 V4-Pro(1.6T MoE,MIT 许可) 与 V4-Flash(284B,低成本推理) 两档,均支持 1M token 上下文,重点突破 Agent 能力与顶级推理,对标 GPT-5 / Claude Opus 4。
关键规格(V4 Preview,2026-04-24 发布)
| 维度 | V4-Pro | V4-Flash |
|---|---|---|
| 发布 | 2026-04-24(Preview)(据 DeepSeek API Docs,T1) | 同上 |
| 参数 | 1.6T 总(MoE) | 284B |
| 上下文 | 1M tokens | 1M tokens |
| 许可证 | MIT 完全开源 + Hugging Face 开源权重 | 开源权重 |
| 架构 | 混合注意力(Compressed Sparse Attention CSA + Heavily Compressed Attention HCA);单 token 推理仅需 V3.2 的 ~27% FLOPs、~10% KV cache | 轻量化,主打低延迟低成本 |
[!info] 上一代衔接 V4 之前 DeepSeek 最后一次发布是 V3.2(及 V3.2 Speciale)于 2025-12;legacy
deepseek-chat/deepseek-reasonerAPI 别名将于 2026-07-24 退役。
市场定位
V4 关键看点:
- 延续"低成本震撼"叙事:V4-Pro 单 token 推理 FLOPs 仅为 V3.2 的约 27%、KV cache 约 10%,把效率优势进一步拉开
- Agent / 推理能力:官方强调 V4 Preview 具备更强 Agent 能力与顶级推理
- 算力来源:仍受美国 2024-12 H100/H800 禁令收紧影响(专有判断,以 4-02-模型工厂 内部研究为准)
客户与部署
- web / app / API 三端 + Hugging Face 开源权重;企业自部署 + 多家云厂商托管
演进路线
DeepSeek V3(2024-12)→ DeepSeek R1(2025-01, 推理专精分支)→ V3.2(2025-12)→ DeepSeek V4 Preview(2026-04-24,V4-Pro 1.6T / V4-Flash 284B)
已废弃叙述
2026-05-29 事实订正:本页原把 V4 当"未发布路线图",实际 V4 Preview 已于 2026-04-24 发布(早于本页创建日);规格由推测的"1T+/512K+"更正为实际"V4-Pro 1.6T / V4-Flash 284B / 1M 上下文"。依据 DeepSeek 官方 API Docs(T1)+ 多家 T2 报道
DeepSeek 下一代旗舰开源 MoE 模型(路线图,预计 2025-H2 ~ 2026 发布),是 DeepSeek V3 的升级版,重点突破多模态、长上下文(512K+)和 Agent 能力,目标对标 GPT-5 / Claude Opus 4 全面能力。
关键规格(路线图,未发布)
| 维度 | 路线图推测 |
|---|---|
| 发布 | 2025-H2 ~ 2026-H1 |
| 参数 | 1T+ 总(MoE)/ 激活规模待定 |
| 上下文 | 512K+ tokens |
| 模态 | 原生多模态(文本+图像+视频) |
| 训练数据 | 25T+ tokens(推测) |
| 训练硬件 | H800 + 部分国产芯片(受美国 2024-12 出口管制影响) |
注:V4 正式规格 DeepSeek 尚未公布,本页 confidence: medium 反映路线图不确定性
演进路线(旧):DeepSeek V3(2024-12)→ DeepSeek R1(2025-01, 推理专精分支)→ DeepSeek V4(2025-H2 ~ 2026-H1)
关联
↑ up::DeepSeek 幻方量化 ↓ down::4-04-模型部署与优化 ⚔ competitor::GPT-5 Claude Opus 4 Llama 4 ∈ belongs_to::4-02-模型工厂